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(57) Abstract 



The invention relates to a method for determining ligands for proteins. Said method comprises determining, by means of secondary 
structural elements of a given protein which form the binding site, molecular surface patches which are compared with known molecular 
surface patches with ligand, 

(57) Zusammenfassung 

Die vorliegende Erfindung betrifft ein Verfahren zur Bestimmung von Liganden fur Proteine. Bei diesem Verfahren werden anhand 
der Sekimdarstrukturelemente eines gegebenen Proteins, die den Bindungsort bilden, molekulare Oberflachenteile bestimmt, die mil bereits 
bekannten molekularen Oberflachenteilen mit Ligand verglichen werden. 
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Ligandenbestimmung fiir Proteine 



Die vorliegende Erfindung betrifft ein Verfahren zur Bestim- 
mung von Liganden fiir Proteine gemaB den Merkmalen des Pa- 
tentanspruches 1. 

In der Biochemie versteht man unter Liganden biologische ak- 
tive Substan2en meist niedermolekularer Art, die durch Bin- 
dung an eine spezifische Bindungsstelle eines Makromolekuls 
eine bestimmte Wirkung auf das Makromolekul ausuben. Bei den 
hier betreffenden Makromolekulen kann es sich um Enzyme, Re- 
zeptoren, DNA , RNA usw. handeln. 

Durch Bindung des Liganden an das Makromolekul konnen bei- 
spielsweise der katalytische Umsatz eines Enzyms, die Akti- 
vierung bzw. Inaktivierung eines Enzyms sowie Konf ormations- 
anderungen von Makromolektilen bewirkt werden. 

In der pharmazeutischen Industrie werden bisher zwei Strate- 
gien zur Identif izierung biologischer aktiver Substanzen, 
d.h. Liganden, angewandt. 

Die Unternehmen verfiigen in der Regel uber groBe Substanz- 
sammlungen vieler verschiedener Einzelverbindungen. Diese 
Substanzen werden in biologischen Systemen, z.B. Zellassays, 
mittels Hochdurchsatzverf ahren in Form von PipettierstraBen 
mit automatischer Auswertung auf bestinunte Aktivitaten gete- 
stet. Treffer bei diesen Verfahren sind allerdings nur zufal- 
lig, sie treten aber mit bestimmten Wahrscheinlichkeiten auf. 

Die Alternative dazu ist eine andere Strategie, die mit Hilfe 
von Computern durchgefuhrt wird. Unter Berechnung der Krafte 
zwischen Molekulen werden am Computer Verbindungen, die an 
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bestimmte Proteinoberf lachen binden sollen, virtuell erstellt 
und dann erst synthetisiert . So werden im Gegensatz zum obi- 
gen Verfahren weniger Substanzen synthetisiert und getestet. 
Es werden auch virtuelle Substanzbibliotheken von Molekiilen, 
die nicht als Substanz vorliegen mlissen, im Dockingverf ahren 
am Computer auf eine Bindung an eine bestimmte Proteinober- 
flache getestet. Wiederum werden dann nur die Treffer synthe- 
Atisiert und in biologischen Testsystemen eingesetzt. Verfah- 
ren dieser Art sind bereits in den US-Patenten 5,495,423, 
5,579,250 und 5,612,895 beschrieben worden. 

In der Praxis wurden auch Kombinat ionen der oben beschriebe- 
nen Verfahren angewendet. 

Bei diesen Verfahren wurden aber keine in der Natur vorkom- 
menden Interakt ionen ausgenutzt. Des weiteren sind viele be- 
kannte Verfahren der Zufalligkeit ausgesetzt und mussen sich 
oftxnals auf die virtuelle Beobachtung sttitzen. Dieses fuhrt 
zu betrSchtlichen Zeitverlusten und Ungenauigkeiten. 

Es ist daher Aufgabe der vorliegenden Erfindung, ein Verfah- 
ren zur Verfugung zu stellen, bei dem die Liganden fur Pro- 
teine schnell und zuverlassig bestimmt werden konnen. 

Die Aufgabe wird mit einem Verfahren gemaB Patentanspruch 1 
gelost . 

Die Unteranspruche betreffen bevorzugte Ausf uhrungsf ormen des 
erf indungsgemafcen Verfahrens. 

Die Erfindung betrifft weiterhin Liganden, die nach dem er- 
f indungsgemSfcen Verfahren hergestellt sind. 

Das erf indungsgemafle Verfahren zur Bestimmung von Liganden 
fur Proteine umfafct folgende Schritte: 
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a) Bestimmung derjenigen Sekundarstrukturelemente eines ge- . 
gebenen Proteins, die den Bindungsort fur den Liganden 
bilden. Insbesondere wird ein Oberf lachenbereich des 
gegebenen Proteins bestimmt, der einen Bindungsort fur 
einen vorherzusagenden Liganden bildet. 

b) Zerlegung der molekularen Oberflache eines gegebenen Pro- 
teins in molekulare Oberf lachenelemente . Insbesondere 
werden die Sekundarstrukturelemente eines Modelles des 
gegebenen Proteins anhand von Wasserstof f briickenverbin- 
dungen definiert, wobei in Abhangigkeit des in a) be- 
stimmtes Oberf lachenbereiches benachbarte Sekundarstruk- 
turelemente zusatzlich zusammengef aftt und grofle Sekundar- 
strukturelemente, die uber den Oberf lachenbereich hinaus- 
ragen, zusatzlich geteilt werden. 

c) Bestimmen von bekannten ahnlichen molekularen Oberfla- 
chenteilen zu denjenigen Oberf lachenelementen, die den 
Bindungsort fur den Liganden definieren, wobei die gefun- 
denen molekularen Oberf ISchenteile ein komplementares 
Nachbarelement besitzen. Insbesondere werden Atome eines 
jeden zu dem in a) definierten Oberf lachenbereich geho- 
renden Sekundarstrukturelementes bestimmt, die einem um- 
gebenden Losungsmittel ausgesetzt sind. Dadurch werden 
Suchflachen definiert. Die Atombestimmung geschieht durch 
Abtasten der Oberflache mit dem Modell eines Wassermole- 
kules auf einer Conolly-Oberf lache. 

Dabei wird insbesondere eine Suchdatenbasis generiert, 
indem Paare miteinander in Kontakt tretender Flachen be- 
stimmt werden anhand aller oder eines Teiles der Proteine 
Oder Proteinkomplexe mit bekannter dreidimensionaler 
Struktur. Die Modelle der Proteine werden in Sekundar- 
strukturelemente und Teile der Sekundarstrukturelemente 
anhand der Wasserstof fbrucken zerlegt und die Atome eines 
Sekundarstrukturelementes, namlich die Kontaktf lache, die 
mit einem anderen oder dem umgebenden Losungsmittel in 
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Van der Waals-Abstand stehen, werden bestimmt. 

Insbesondere werden ahnliche Flachen zu denjenigen Ober- 
f lachenelementen bestimmt, die den zu bestimmenden Bin- 
dungsort fur den Liganden definieren, wobei die gefunde- 
nen molekularen Oberflachen ein komplementares Nachbar- 
element besitzen. Dabei werden der Schwerpunkt und die 
Hauptausdehnung aller Suchflachen ait alien oder einem 
Teil der bestimmten Flache uberlagert. Die Uberlagerung 
wird durch Maximierung der uberlagerten Atome und 
Minimierung der quadratischen Fehlerabweichung optimiert. 

d) Koordinatentransformation des gefundenen ahnlichen mole- 
kularen Oberf lachenteils mit Nachbarelement auf ein Aus- 
gangselement bei einem rms-Wert unterhalb von 2A. Insbe- 
sondere wird eine Koordinatentransformation der gefunde- 
nen Flache in die Suchflache fur gegebene Protein durch- 
geftihrt. 

e) Beurteilung der PaBfahigkeit des Liganden gemSB lokaler 
Packungsdichte. Insbesondere wird die Uberlagerung nach 
Anzahl der uberlagerten Atome, nach Anzahl der uberlager- 
ten Atome gleicher Atomsorte und der quadratischen Feh- 
lerabweichung durchgefuhrt. Ein Treffer kann anhand der 
lokalen Packungsdichte bewertet werden, die durch das Ge- 
genuber der gefundenen Flache und dem gegebenen Protein 
bestimmt ist. 



Der Ablauf des erf indungsgemaGen Verfahrens wird anhand des 
in Fig. 1 gezeigten Fl ieBdiagramms erlautert. 

Vorzugsweise wird das erf indungsgemaBe Verfahren insbesondere 
nach Schritt e) auf der Grundlage einer Datenbank durchge- 
ftthrt. Es hat sich als zweckmaftig erwiesen, die Datenbank 
"Dictionary of Interfaces in Proteins (DIP) 1 1 Journal of 
Molecular Biology, Bd. 280, S. 535ff, 1998, zu verwenden. Die 
Datenbank DIP stellt Flachen zwischen Sekundarstrukturen 
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(SSE) aller strukturell bekannten Proteine zur Verfugung. 
Diese Interfaces bestehen aus zwei Atommengen (Patches) , die 
Teile von benachbarten Sekundarstrukturen sind und zusammen 
den Kontakt dieser beiden Strukturen ausmachen. 

Bei der Bestimmung von Liganden, dem sogenannten M drug de- 
sign 11 , stellt sich die Frage, welche chemische Verbindung zu 
einer gegebenen Proteinstruktur paBt. Erf indungsgemaB werden 
die Sekundarstrukturelemente eines gegebenen Proteins, die 
den Bindungsort fur den Liganden bilden, bestimmt. Dann wird 
die molekulare Oberflache eines gegebenen Proteins zunachst 
in molekulare Oberf lachenteile (MSP = molecular surface 
patches) zerlegt. Zu denjenigen Elementen, die potentiell die 
Bindungsregion definieren, werden beispielsweise aus der oben 
beschriebenen Datenbank ahnliche Flachen herausgesucht . Als 
Nebenbedingung wird bei dem Screening auf Ahnlichkeit ver- 
langt, daB die gefundenen MSPs bereits ein kompleraentares 
Nachbarelement besitzen. Eine Transformation, beispielsweise 
Koordinatentransf ormation, des gefundenen MSP mit Nachbarele- 
ment auf das Ausgangselement ist dann aussichtsreich , wenn 
der rms-Wert (mittlerer Fehler) unterhalb von 2A liegt. Vor- 
zugsweise liegt der Wert bei 1,5 A. Fur die Beurteilung der 
PaBfahigkeit des Liganden gegenuber dem Original hat sich die 
lokale Packungsdichte nach Goede et al., Journal of Computa- 
tional Chemistry, Bd. 18, Nr. 9, s. lll4ff, 1997, bewahrt. 

Bei dem erf indungsgemaBen Verfahren sollen die AuBenflachen 
der Sekundarstrukturen bestimmt werden. Die AuBenflachen, die 
den Kontakt herstellen, sind die MSP . Ahnliche molekulare 
Oberf lachenteile werden uberlagert. Nach der Koordinaten- 
transf ormation liegen die gefundenen molekularen Oberflachen- 
teile auf Atomen des Bindungsortes . Die besten potentiellen 
Liganden bilden die Leitverbindung . Der Vergleich der besten 
potentiellen Liganden mit einem bekannten Ausgangsprotein 
plus Ligand erfolgt als letztes. 
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Somit erfolgt erf indungsgemaft die Bestinunung eines komplemen- 
taren Bindungspartners dadurch, daft ahnliche Elemente be- 
stimmt werden, die bereits einen Bindungspartner besitzen, 

Wenn die Liganden, bei denen es sich um Sekundarstrukturele- 
mente aus ca. 10 Aminosauren handelt, bestimmt sind, miissen 
sie fur den Einsatz als Pharmakon noch optimiert werden, da 
Peptide aus den naturlichen L-Aminosauren vielen Anforderun- 
gen nicht entsprechen. 

Es gibt experimentelle Verfahren zur synthetischen Umwandlung 
von Peptiden in Pept idmimet ika , z.B. Peptoide, die vom phar- 
inakologischen Standpunkt aus betrachtet, haufig wesentlich 
giinstigere Eigenschaf ten aufweisen. Die Verbindungen durch- 
laufen dabei in der Regel verschiedene Optimierungszyklen, in 
denen die Molekule auch wirklich als Substanzen vorliegen. 

Eine weitere Moglichkeit, Leitverbindungen zu finden, besteht 
in der Suche in Datenbanken niedermolekularer Verbindungen. 
In diesem Falle werden die Koordinaten des entsprechenden 
passfahigen Peptids oder Teile davon verwendet, um in einer 
entsprechenden Datenbank nach dem angegebenen Uberlagerungs- 
verfahren ( Vergleichsverf ahren) zu suchen. Damit ist es mog- 
lich, vollig unabhangig von der peptidischen Grundstruktur 
Leitverbindungen zu finden. 

Das erf indungsgemaSe Verfahren zur Bestimmung von Liganden 
wird vorzugsweise fur die aktiven Zentren von Enzymen be- 
schrieben. Das Verfahren ist allerdings auch auf andere 
MakromolekUle (Proteine, DNA, RNA) ubertragbar, sofern sie 
geeignete Oberflachen besitzen. Folgende Anwendungsgebiete 
kommen beispielsweise in Betracht: 

* Bindungs- und/oder Nachweismolekule in diagnostischen 
Assays 

* Lebensmittelindustrie: Suche von Liganden fur Geschmacks- 
rezeptoren und Verwendung als Geschmackszusatzstof f 
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* Biotechnologie: Molekiile fur die Af f initatsreinigung 

* Proteine, die im therapeutischen Bereich gebunden werden 
mUssen: Enzyme, Rezeptoren, DNA, RNA 

Zytokine oder Wachstumsf aktoren und ihre 
Rezeptoren, insbesondere diejenigen, die der 
Stof fwechselregulation dienen 
Zelladhasionsproteine und ihre Rezeptoren 
Proteine der Signaltransduktionswege und ihre 
Bindungspartner 

zytosolische Rezeptoren, Steroidrezeptoren 

Proteine der Blutgerinnung 

Neurotransmitter und ihre Rezeptoren 

Proteine der Stof f wechselwege 

Proteine der Replikation, Transkription und 

Translation 

Proteine von Krankheitserregern (Bakterien, 
Viren, eukaryotische Einzeller, Parasiten) 

Das erfindungsgemaBe Verfahren laBt sich auch zur Bestimmung 
von Proteinstrukturen anwenden. Es ist nicht auf alleinige 
Sequenzahnlichkeit angewiesen, sondern verwendet Strukturahn- 
lichkeit von molekularen Grenzflachen von Sekundarstruktur- 
elementen zur Vorhersage ihrer Wechselwirkungspartner . Dabei 
wird der Tatsache Rechnung getragen, daB gleiche (ahnliche) 
Grenzflachen auch bei unterschiedlichen Sequenzen entstehen 
konnen. 

Beispielhaft soil im folgenden das Verfahren der Protein- 
strukturbestimmung in seinen Schritten geschildert werden. 

Im ersten Schritt wird eine gegebene Primarstruktur in ihrer 
vollen Lange in eine repetitive Sekundarstruktur "gewik- 
kelt 11 . Dies bedeutet, daft mit Standard <J), ip und X~Winkeln B- 
Faltblatter bzw. o-Helices liber die voile Lange der Primar- 
struktur errechnet werden. 
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Im zweiten Schritt werden die entstandenen molekularen Grenz- 
flachen dieser Sekundarstrukturelemente geclustert und mit 
einem artif iziellen neuronalen Netz bewertet, dessen Ein- 
gangsdaten sich aus den molekularen Oberflachen der ge- 
clusterten Strukturelemente ergeben. Die Bewertung erfolgt 
mit dem Ziel, einerseits zu bestatigen, ob iiberhaupt mit der 
gegebenen Primarstruktur molekulare Oberflachen bei dem Se- 
'kundarstrukturelement zu gestalten sind, die reprasentativ 
fur das gegebene Strukturelement sind. Wenn nicht, wird die 
Sekundarstruktur verworfen. Damit ergibt sich ein neues Ver- 
fahren der Sekundarstrukturvorhersage . Das neuronale Netz 
wird anhand der bekannten Proteinstrukturen trainiert. 

Alternativ zur allgemeinen Strukturbildung auf der Grundlage 
von Standard <p und x-Winkeln fur Helices bzw. Faltblattern 
konnen bekannte Sekundarstrukturvorhersagealgorithmen ange- 
wendet werden, so daB das vorgenannte Verfahren nur auf die 
vorhergesagten Strukturen (Teile der Sequenz) angewandt wird. 
In einem weiteren Schritt werden die gefundenen Cluster, die 
Kontakt zu einem bestimmten Sekundarstrukturelement (oder 
Solvent) haben, verwendet, urn in der Datenbank DIP gleiche 
oder ahnliche molekulare Oberflachen und deren Nachbarn zu 
suchen. Dies geschieht mit dem weiter oben schon beschriebe- 
nen bias-freien liber lagerungsa lgorithmus fur atomare Sets, 

Aus dem vorgenannten Arbeitsschritt ergeben sich eine Reihe 
von MPS, deren Partnerelement sicher bzw. weniger sicher 
(Variantenplanung) festliegt. Wird dabei 1 ' nicht-Solvent 1 1 
vorhergesagt, versucht ein einfacher Docking-Algorithmus im 
dritten Schritt eine passende Flache in anderen Sekundar- 
strukturelementen als dem direkt betrachteten zu lokalisie- 
ren. Der einfache Docking-Algorithmus beruht auf der Tatsa- 
che, daB molekulare Grenzf lachenpartner zwischen Sekundar- 
strukturen innerhalb eines gegebenen Abstandes der beiden 
Schwerpunkte bzw. einem bestimmten Winkel der ausgezeichneten 
Richtung gesucht werden kann. Die Qualitat der PaBfahigkeit 
wird mit Hilfe der molekularen Dichtebestimmung uberpruft 
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(siehe oben, Goede et al.)- Liegen die potentiellen Partner 
fest, wird in einem vierten Schritt die prinzipielle Faltbar- 
keit unter Einhaltung aller vorhergesagten Nachbarschaf ten 
(Solvent, Helix-Helix, Helix-coil, Helix-extended) uberpriift 
und die allgemeine Faltung oder mehrere Varianten von der ge- 
gebenen Sequenz angenommen. 

Das folgende Beispiel soil das erf indungsgemaBe Verfahren 
erlSutern. 

Beispiel 

Inhibitor-Design fur das Proteasom 

Ausgehend von einem Bindungsort einer aktiven Untereinheit 
des Proteasoms bei Hefe werden die Sekundarelemente bestimmt, 
die den Bindungsort bilden. Es stellt sich heraus, daB funf 
Elemente beteiligt sind, wobei zwei groBere Elemente den Bin- 
dungsort bestimmen. AnschlieBend werden die AuBenflachen die- 
ser Sekundarstrukturen bestimmt. Mit den Teilen der AuBenfla- 
chen, die den Kontakt ausmachen und 12 bis 22 Atome umfassen, 
werden in der DIP-Datenbank ahnliche MSPs gesucht. Die ahnli- 
chen MSPs von einer bestimmten Mindestgute, wobei mindestens 
70% der Atome uberlagert sind und der rms-Wert 1,0A betragt, 
werden mit den Ausgangsf lachen uberlagert, wobei die Ami- 
nosauren, die die Gegenseite der MSPs bilden bei der Koordi- 
natentransformation der MSPs einbezogen werden, Nach der Ko- 
ordinatentransf ormation liegen die gefundenen MSPs auf den 
Atomen des Bindungsortes, die Gegenseiten der MSPs in der 
Bindungstasche . 

Die Gegenseiten der gefundenen MSPs, die die potentiellen 
Liganden darstellen, werden dahingehend uberpriift, ob sie die 
Bindungstasche ausftillen und ob die Abstande zu den Atomen 
der Bindungstasche groB genug sind. Dafur wird die lokale 
Dichte in der Bindungstasche berechnet. Die besten potentiel- 
len Liganden bilden die Leitverbindungen. 
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Ein Vergleich der zehn besten potentiellen Liganden rait einer 
Proteasom-Struktur des Archaebakteriums , die rait Ligand vor- 
liegt, ergibt, daft die Hauptkette von einer der auf diese 
Weise berechneten Strukturen vollig identisch zu dera bekann- 
ten Inhibitor des Proteasoras des Archebakteriuras ist. 
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PATENTANSPRUCHE 

1. Verfahren zur Bestimmung von Liganden fur Proteine, das 
folgende Schritte umfaSt: 

a) Bestimmen der Sekundarstrukturelemente eines gegebenen 
Proteins, die den Bindungsort fur den Liganden bilden; 

b) Zerlegung der molekularen Oberflache des Proteins in 
molekulare Oberf lachenelemente ; 

c) Bestimmen von ahnlichen Flachen zu denjenigen Oberfla- 
chenelementen, die die zu bestimmende Bindungsregion fur 
den Liganden definieren, wobei die gefundenen molekularen 
Oberf lachenteile ein komplementares Nachbarelement besit- 
zen; 

d) Koordinatentransf ormation des gefundenen molekularen 
Oberf lachenteils mit Nachbarelement auf ein Ausgangs- 
element bei einem rms-Wert unterhalb von 2A und 

e) Beurteilung der PaBfahigkeit des Liganden gemaG lokaler 
Packungsdichte. 

2. Verfahren nach Anspruch l, bei dem die AuGenf lachen der 
Sekundarstrukturen bestimmt werden, wobei die AuBenf lachen, 
die den Kontakt herstellen, bevorzugt die molekularen Ober- 
flSchenteile sind. 

3. Verfahren nach Anspruch 1 oder 2, bei dem die ahnlichen 
molekularen Oberf lachenteile mit den Ausgangsf lachen uberla- 
gert werden. 

4. Verfahren nach einem der vorangegangenen Anspriiche, bei 
dem nach der Koordinatentransf ormation die gefundenen moleku- 
laren Oberf lachenteile auf Atomen des Bindungsortes liegen. 

5. Verfahren nach einem der vorangegangenen Anspriiche, bei 
dem die besten potentiellen Liganden die Leitverbindung bil- 
den und/oder mit einem bekannten Ausgangsprotein plus Ligand 
verglichen werden. 
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6. Verfahren nach Anspruch 1, bei dem die Liganden in Form 
von Peptiden bestimmt werden, die bevorzugt etwa zehn Amino- 
sauren umfassen und bevorzugt anschlieftend in ein Peptidmime- 
tikum umgewandelt wird. 

7. Verfahren nach einem der vorhergehenden Anspruche, bei 
den die Proteine Enzyme sind. 

8. Verfahren nach Anspruch 1, bei dem der rms-Wert i,5A 
betragt . 

9. Verfahren nach einem der vorangegangenen Anspruche, 
dadurch gekennzeichnet , daB es zur Strukturbestimmung von 
Proteinen angewendet wird. 

10* Verwendung eines nach den Anspruchen 1 bis 12 herge- 
stellten Ligands zur Herstellung eines Pharmakons. 
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